998 resultados para Extracção de informação


Relevância:

60.00% 60.00%

Publicador:

Resumo:

The electronic storage of medical patient data is becoming a daily experience in most of the practices and hospitals worldwide. However, much of the data available is in free-form text, a convenient way of expressing concepts and events, but especially challenging if one wants to perform automatic searches, summarization or statistical analysis. Information Extraction can relieve some of these problems by offering a semantically informed interpretation and abstraction of the texts. MedInX, the Medical Information eXtraction system presented in this document, is the first information extraction system developed to process textual clinical discharge records written in Portuguese. The main goal of the system is to improve access to the information locked up in unstructured text, and, consequently, the efficiency of the health care process, by allowing faster and reliable access to quality information on health, for both patient and health professionals. MedInX components are based on Natural Language Processing principles, and provide several mechanisms to read, process and utilize external resources, such as terminologies and ontologies, in the process of automatic mapping of free text reports onto a structured representation. However, the flexible and scalable architecture of the system, also allowed its application to the task of Named Entity Recognition on a shared evaluation contest focused on Portuguese general domain free-form texts. The evaluation of the system on a set of authentic hospital discharge letters indicates that the system performs with 95% F-measure, on the task of entity recognition, and 95% precision on the task of relation extraction. Example applications, demonstrating the use of MedInX capabilities in real applications in the hospital setting, are also presented in this document. These applications were designed to answer common clinical problems related with the automatic coding of diagnoses and other health-related conditions described in the documents, according to the international classification systems ICD-9-CM and ICF. The automatic review of the content and completeness of the documents is an example of another developed application, denominated MedInX Clinical Audit system.

Relevância:

60.00% 60.00%

Publicador:

Resumo:

For the actual existence of e-government it is necessary and crucial to provide public information and documentation, making its access simple to citizens. A portion, not necessarily small, of these documents is in an unstructured form and in natural language, and consequently outside of which the current search systems are generally able to cope and effectively handle. Thus, in thesis, it is possible to improve access to these contents using systems that process natural language and create structured information, particularly if supported in semantics. In order to put this thesis to test, this work was developed in three major phases: (1) design of a conceptual model integrating the creation of structured information and making it available to various actors, in line with the vision of e-government 2.0; (2) definition and development of a prototype instantiating the key modules of this conceptual model, including ontology based information extraction supported by examples of relevant information, knowledge management and access based on natural language; (3) assessment of the usability and acceptability of querying information as made possible by the prototype - and in consequence of the conceptual model - by users in a realistic scenario, that included comparison with existing forms of access. In addition to this evaluation, at another level more related to technology assessment and not to the model, evaluations were made on the performance of the subsystem responsible for information extraction. The evaluation results show that the proposed model was perceived as more effective and useful than the alternatives. Associated with the performance of the prototype to extract information from documents, comparable to the state of the art, results demonstrate the feasibility and advantages, with current technology, of using natural language processing and integration of semantic information to improve access to unstructured contents in natural language. The conceptual model and the prototype demonstrator intend to contribute to the future existence of more sophisticated search systems that are also more suitable for e-government. To have transparency in governance, active citizenship, greater agility in the interaction with the public administration, among others, it is necessary that citizens and businesses have quick and easy access to official information, even if it was originally created in natural language.

Relevância:

60.00% 60.00%

Publicador:

Resumo:

Tese de doutoramento, Informática (Engenharia Informática), Universidade de Lisboa, Faculdade de Ciências, 2014

Relevância:

60.00% 60.00%

Publicador:

Resumo:

A evolução tecnológica tem provocado uma evolução na medicina, através de sistemas computacionais voltados para o armazenamento, captura e disponibilização de informações médicas. Os relatórios médicos são, na maior parte das vezes, guardados num texto livre não estruturado e escritos com vocabulário proprietário, podendo ocasionar falhas de interpretação. Através das linguagens da Web Semântica, é possível utilizar antologias como modo de estruturar e padronizar a informação dos relatórios médicos, adicionando¬ lhe anotações semânticas. A informação contida nos relatórios pode desta forma ser publicada na Web, permitindo às máquinas o processamento automático da informação. No entanto, o processo de criação de antologias é bastante complexo, pois existe o problema de criar uma ontologia que não cubra todo o domínio pretendido. Este trabalho incide na criação de uma ontologia e respectiva povoação, através de técnicas de PLN e Aprendizagem Automática que permitem extrair a informação dos relatórios médicos. Foi desenvolvida uma aplicação, que permite ao utilizador converter relatórios do formato digital para o formato OWL. ABSTRACT: Technological evolution has caused a medicine evolution through computer systems which allow storage, gathering and availability of medical information. Medical reports are, most of the times, stored in a non-structured free text and written in a personal way so that misunderstandings may occur. Through Semantic Web languages, it’s possible to use ontology as a way to structure and standardize medical reports information by adding semantic notes. The information in those reports can, by these means, be displayed on the web, allowing machines automatic information processing. However, the process of creating ontology is very complex, as there is a risk creating of an ontology that not covering the whole desired domain. This work is about creation of an ontology and its population through NLP and Machine Learning techniques to extract information from medical reports. An application was developed which allows the user to convert reports from digital for¬ mat to OWL format.

Relevância:

60.00% 60.00%

Publicador:

Resumo:

As descrições de produtos turísticos na área da hotelaria, aviação, rent-a-car e pacotes de férias baseiam-se sobretudo em descrições textuais em língua natural muito heterogénea com estilos, apresentações e conteúdos muito diferentes entre si. Uma vez que o sector do turismo é bastante dinâmico e que os seus produtos e ofertas estão constantemente em alteração, o tratamento manual de normalização de toda essa informação não é possível. Neste trabalho construiu-se um protótipo que permite a classificação e extracção automática de informação a partir de descrições de produtos de turismo. Inicialmente a informação é classificada quanto ao tipo. Seguidamente são extraídos os elementos relevantes de cada tipo e gerados objectos facilmente computáveis. Sobre os objectos extraídos, o protótipo com recurso a modelos de textos e imagens gera automaticamente descrições normalizadas e orientadas a um determinado mercado. Esta versatilidade permite um novo conjunto de serviços na promoção e venda dos produtos que seria impossível implementar com a informação original. Este protótipo, embora possa ser aplicado a outros domínios, foi avaliado na normalização da descrição de hotéis. As frases descritivas do hotel são classificadas consoante o seu tipo (Local, Serviços e/ou Equipamento) através de um algoritmo de aprendizagem automática que obtém valores médios de cobertura de 96% e precisão de 72%. A cobertura foi considerada a medida mais importante uma vez que a sua maximização permite que não se percam frases para processamentos posteriores. Este trabalho permitiu também a construção e população de uma base de dados de hotéis que possibilita a pesquisa de hotéis pelas suas características. Esta funcionalidade não seria possível utilizando os conteúdos originais. ABSTRACT: The description of tourism products, like hotel, aviation, rent-a-car and holiday packages, is strongly supported on natural language expressions. Due to the extent of tourism offers and considering the high dynamics in the tourism sector, manual data management is not a reliable or scalable solution. Offer descriptions - in the order of thousands - are structured in different ways, possibly comprising different languages, complementing and/or overlap one another. This work aims at creating a prototype for the automatic classification and extraction of relevant knowledge from tourism-related text expressions. Captured knowledge is represented in a normalized/standard format to enable new services based on this information in order to promote and sale tourism products that would be impossible to implement with the raw information. Although it could be applied to other areas, this prototype was evaluated in the normalization of hotel descriptions. Hotels descriptive sentences are classified according their type (Location, Services and/or Equipment) using a machine learning algorithm. The built setting obtained an average recall of 96% and precision of 72%. Recall considered the most important measure of performance since its maximization allows that sentences were not lost in further processes. As a side product a database of hotels was built and populated with search facilities on its characteristics. This ability would not be possible using the original contents.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Guia destinado ao cidadão, para dar conhecimento a este a respeito das novas determinações trazidas pela Lei nº 12.527/11. Destaca os principais pontos da norma e apresenta as diversas formas de acesso a informações na Câmara dos Deputados.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Em cumprimento ao disposto no art. 30 da Lei nº 12.527, de 2011, a Câmara dos Deputados apresenta à sociedade brasileira seu primeiro relatório consolidado sobre a aplicação da Lei de Acesso a Informação – LAI. Este relatório é dividido em três seções e um apêndice metodológico. A primeira seção traz informações e dados estatísticos sobre as solicitações de acesso a informação recebidas pela Câmara dos Deputados entre os dias 16/05/2012, data de início de vigência da LAI, e 30/04/2013. Além de tabela específica sobre solicitações de informação recebidas, atendidas e indeferidas, são apresentados dados consolidados sobre a distribuição temática dos requerimentos, as razões para indeferimento e a distribuição dos prazos de atendimento das solicitações.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Apresenta a proposta de um modelo de mapa do conhecimento, como ferramenta informacional em gestão de competências, aplicado à Câmara Legislativa do Distrito Federal - CLDF, para auxiliar no processo de governança legislativa. São abordados e discutidos os conceitos de administração pública gerencial; competência; competência nas organizações e alguns modelos, métodos e técnicas de gestão de competências. Apresenta, ainda, o mapeamento das áreas de competência existentes na CLDF, e a modelagem e classificação das competências por áreas. O modelo proposto envolveu a construção de um modelo de dados; de uma taxonomia institucional; de uma arquitetura da informação, com concepção do padrão institucional de metadados, do repositório da taxonomia e dos metadados; e a definição das unidades organizacionais responsáveis pelo gerenciamento do conteúdo e da operacionalização do sistema, com suas atribuições e responsabilidades. Por fim, recomenda a aplicação do modelo e a ampliação do estudo em instituições públicas e, particularmente, nas instituições do poder legislativo municipal, estadual e federal.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Relato da experiência da Coordenação de Estudos Legislativos da Câmara dos Deputados no processo de organização e recuperação da informação legislativa produzida pelo Poder Legislativo Brasileiro. O Sistema de Legislação Informatizada (LEGIN) foi criado em 2001 com a finalidade de ser a aplicação responsável pelo gerenciamento e recuperação das normas federais e internas da Câmara dos Deputados produzidas desde o período do Império.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Faz uma análise sobre a classificação e utilização da informação sigilosa na Suécia, Finlândia, Norugega, Dinamarca, Grã-Bretanha e Estados Unidos.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Consultoria Legislativa - Área XIV - Comunicação Social, Informática, Telecomunicações, Sistema Postal, Ciência eTecnologia.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Consultoria Legislativa - Grupo de Trabalho de Política Econômica.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Enumera algumas das principais realizações do Centro de Informática (Cenin) ao longo de 2011. Figuram entre elas projetos concluídos, produtos e sistemas entregues aos usuários, dados sobre evolução dos serviços de Tecnologia da Informação e Comunicação (TIC) e informações sobre acordos de cooperação internacional da Câmara dos Deputados, por meio do Cenin, com outros países.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

O presente relatório elenca algumas das principais realizações do Centro de Informática (Cenin) ao longo de 2012. Entre elas, figuram projetos e atividades que resultaram em produtos (sistemas e serviços) entregues aos usuários de Tecnologia da Informação (TI) da Câmara dos Deputados; indicadores sobre recursos de TI; e breve relato sobre apoio prestado pela Casa ao plano estratégico de TI da Assembleia da República de Moçambique.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Notícia sobre o II Encontro Interparlamentar de Quadros das Áreas de Documentação, Informação e Arquivo dos Parlamentos de Língua Portuguesa que teve como objetivo, além do intercâmbio de boas práticas, reforçar os laços de colaboração técnica entre os Parlamentos de Angola, Brasil, Cabo Verde, Guiné Bissau, Moçambique, São Tomé e Príncipe, Portugal e Timor Leste.